ویرایش گر متن شریف: سامانۀ ویرایش و خطایابی املایی زبان فارسی

Authors

بهرام وزیرنژاد

دانشگاه صنعتی شریف، ساختمان ابن سینا، طبقه چهارم، مرکز زبان ها و زبان شناسی فاطمه سلطانزاده

دانشگاه صنعتی شریف، ساختمان ابن سینا، طبقه چهارم، مرکز زبان ها و زبان شناسی محسن مهدوی

دانشگاه صنعتی شریف، ساختمان ابن سینا، طبقه چهارم، مرکز زبان ها و زبان شناسی مهدی مرادی

دانشگاه صنعتی شریف، ساختمان ابن سینا، طبقه چهارم، مرکز زبان ها و زبان شناسی

abstract

در مقالۀ حاضر سامانه ای هوشمند جهت ویرایش و خطایابی املایی متون فارسی معرفی شده است. هدف از طراحی و ایجاد این سامانه، ویرایش متون فارسی برای کاربردهای پردازش زبان طبیعی است. این سامانه بر مبنای یک رویکرد مهندسی قابل توسعه، از سه زیرسامانه تشکیل شده است: ویرایش گر متن فارسی معیار، خطایاب املایی خودکار زبان فارسی و ستاک یاب واژگان زبان فارسی. این سه بخش با یکدیگر در تعاملند؛ بدین شکل که ابتدا ستاک واژه های متن شناسایی می شود و در صورت عدم وجود ستاک در فهرست واژه های زبان، واژۀ مذکور به عنوان واژه ای نادرست شناسایی خواهد شد و سپس خطایاب خودکار فهرستی از واژه های جایگزین را پیشنهاد خواهد کرد. در زیرسامانۀ ویرایش گر، متن موجود ویرایش شده و متنی یکپارچه که منطبق بر معیارهای مصوب فرهنگستان زبان و ادب فارسی است، به کاربر ارائه خواهد شد. نتایج ارزیابی نشان دهندۀ دقتی بسیار خوب در حدود 95% در ستاک یابی کلمات، 92% در ویرایش و 96% در خطایابی املایی زبان فارسی است.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

ویرایش‌گر متن شریف: سامانۀ ویرایش و خطایابی املایی زبان فارسی

In this paper, we will introduce an intelligent system to edit and spell check Persian texts. The goal is editing and preprocessing Persian texts for natural language processing tasks. This system is based on an expandable and engineering approach and is composed of three subsystems: Persian text editor, spell checker and stemmer. These parts interact with each other to edit texts. To do this, ...

full text

بیانیه‌ی هلسینکی ویرایش 2008، ترجمه‌ی فارسی و چالش‌‌های آن

The Declaration of Helsinki, the most creditable ethical guideline for medical research on human subjects, has been updated 8 times since its establishment and the last revision was in 2008. Researchers, medical research subjects, authors, members of ethics committees, and editors of medical journals must be informed of the tenets of the Helsinki declaration in order to improve achievements of ...

full text

ویژگی های روانسنجی نسخه فارسی یازدهمین ویرایش مقیاس تکانشگری بارت

هدف از این پژوهش، تبیین شاخص‌های روان سنجی فرم فارسی مقیاس تکانشگری بارت (11BIS-) بوده است. این مقیاس روی یک گروه 259 نفری دانشجویان دانشگاه شیراز (174مرد، 85 زن) که به شیوه نمونه در دسترس انتخاب شده بود، اجرا گردید. به منظور بررسی ساختار عاملی این مقیاس از روش تحلیل عامل اکتشافی به با روش مؤلفه های اصلی چرخش واریماکس استفاده شد. نتایج این تحلیل حاکی از وجود سه عامل با نام های تکانشگری عدم برنا...

full text

ویرایش 2013 بیانیه‌ی هلسینکی و چالش‌ها و تغییرات آن نسبت به ویرایش 2008

The Declaration of Helsinki is one of the most important international documents in medical research ethics on human subjects which has been revised 7 times and the last revision was in 2013. Researchers must be informed of the principle of Helsinki declaration and the latest changes in order to respect the rights of participants in medical research. In this study, the last version of the decla...

full text

My Resources

Save resource for easier access later


Journal title:
پردازش علائم و داده ها

جلد ۱۲، شماره ۴، صفحات ۴۳-۵۲

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023